国产大模型登顶世界开源领域第一?!阿里这次放大招了
现在免费的 AI 工具越来越多,前两天,阿里的大模型通义千问APP更名为通义APP,不知道大家收到风声没。
除了改名字,通义千问底层的模型版本从 2.1 升级到了 2.5 版本,其中文性能全面赶超GPT4 Turbo,成“最强中文大模型”!
官方的说法是:
在中文语境下,文本理解、文本生成、知识问答 & 生活建议、闲聊 & 对话和安全风险等多项能力上赶超 GPT-4。
通义千问 2.5 相比通义千问 2.1 有多项能力提升,理解能力提升 9%,逻辑推理提升 16%,指令遵循提升 19%,代码能力提升 10%。
而且在开源版本上,也取得了非常不错的成绩:通义千问最新开源的 1100 亿参数模型在多个基准测评收获最佳成绩,超越 Meta 的 Llama-3-70B,成为“开源领域最强大模型”。
上面的数据听起来就感觉很强的样子,回顾了一下,果核发现通义的大模型不只是说说,更像是在布局AI模型应用的生态圈,探索更多玩法,属于国内 AI 产品中比较积极活跃的一员。
在社交媒体上也经常出现相关的消息,像是给普通用户使用的趣味工具“全民舞王”(彩蛋,上面这个猫咪跳舞就是用通义APP制作的),给开发者使用的“通义灵码”,用来专门处理法律问题的“通义法睿”等等。
经常关注软件内容,都能引起大家一阵一阵地讨论,有时候还会上热搜。
不只是在阿里自己的产品线里,在很多大家看不见的地方其实也有通义的影子,各位比较熟悉的“小爱同学”也与通义达成了合作,后续可能会进行多模态、OS 深度整合、端侧大模型等升级。
比起这种在后台默默细化使用场景的“润物细无声”,集合了通义大模型大多优点的通义网页版和APP,则是最能让大家感知到变化的实际应用场景了。
现在打开通义的官网,它会提示你“通义-对话”和“通义-效率”已经更新了,用来速读文件和网络内容都不在话下。
它也内置了许多人设的智能体,现在可以直接点击用。
不过这个功能和能访问链接等功能,已经属于AI 标配了,没啥好说的,来看点有趣的。
点击上传文档你能看到这个提示,通义支持批量上传100个文档,每个文档的上限是150MB,这个处理能力就很恐怖了,单次的处理文本长度是 1000 万字。
这也是能免费用的吗?这下处理文档的能力又上了一个台阶。
另外,通义的识图与理解能力很强,它竟然能看懂卡通的梗图。
实拍的图片和一些经典的网图也能解析出来,能分辨颜色,残缺信息和文字信息等等。
也可以对图片内容进行问题推理。
甚至你还可以截图一个网页,让它生成类似的布局代码,而且它不仅仅是给你输出代码,他还会理解你的需求,一步一步教你怎么实现类似的效果。
在通义的效率工具里,还更新了不少好玩的工具,这些都可以单独出一期推荐了,这些效率模块是比较好玩的地方,也可以理解成插件模块化的探索,将AI工具结合起来,像是实:时语音转文字、音频提取文字、总结网页、文档阅读和播客RSS内容总结。
看了一下,它的音视频文件转写支持 6 个小时的内容,单次 50 个视频,最大 6 个G,光是这参数就令人害怕!
最离谱的是除了内容读取,它还支持翻译日语和英语,这不比付费工具好使?!
这些功能如果长久免费下去,应该挺烧钱。果核看了一下,发现他们现在只要每日登录就赠送10小时转写时长 ,大家正好可以免费使用一段时间。
有一个专门的网页阅读功能,这个与直接发链接让通义总结不同,这属于一个单独的工具,放进去链接之后,通义会把整个网页的内容下载后再“仔细品味”,有单独的总结与翻译页面。
同样,如果你给的链接是一个文档,你都不用下载到本地,直接给通义链接就行,这做法就很不错。
如果是播客RSS内容还可以进行速览和文字提取。
还有一个百宝袋,这里收集了许多细分的小功能。
通义大模型开源之后,迎来了不少开发者和用户的好评,在国外也有不少讨论的声音。
大家如果要体验这个通义 2.5 的最新版本,可以直接访问下面的官网地址即可,不需要等待名单啥的,直接上手!
通义:
https://tongyi.aliyun.com/qianwen